Conjunto de dados flor Iris

Diferenças entre flores de Íris

O conjunto de dados flor Iris ou conjunto de dados Iris de Fisher é um conjunto de dados multivariados introduzido pelo estatístico e biólogo britânico Ronald Fisher em seu artigo de 1936, O uso de múltiplas medições em problemas taxonômicos, como um exemplo de análise discriminante linear.[1] Às vezes, é chamado de conjunto de dados da íris de Anderson porque Edgar Anderson coletou os dados para quantificar a variação morfológica das flores da íris de três espécies relacionadas.[2] Duas das três espécies foram coletadas na Península de Gaspé, "todas do mesmo campo, colhidas no mesmo dia e medidas ao mesmo tempo pela mesma pessoa com a mesma aparelho".[3]

O conjunto de dados consiste em 50 amostras de cada uma das três espécies de Iris ( Iris setosa, Iris virginica e Iris versicolor). Quatro variáveis foram medidas em cada amostra: o comprimento e a largura das sépalas e pétalas, em centímetros. Com base na combinação dessas quatro características, Fisher desenvolveu um modelo discriminante linear para distinguir as espécies umas das outras.

  1. R. A. Fisher (1936). «The use of multiple measurements in taxonomic problems». Annals of Eugenics. 7: 179–188. doi:10.1111/j.1469-1809.1936.tb02137.x  |hdl-access= requer |hdl= (ajuda)
  2. Edgar Anderson (1936). «The species problem in Iris». Annals of the Missouri Botanical Garden. 23: 457–509. JSTOR 2394164. doi:10.2307/2394164 
  3. Edgar Anderson (1935). «The irises of the Gaspé Peninsula». Bulletin of the American Iris Society. 59: 2–5 

© MMXXIII Rich X Search. We shall prevail. All rights reserved. Rich X Search